现代物联网(IoT)环境通过大量IoT启用的传感设备进行监视,并根据计算能力和能源的数据采集和处理基础架构设置限制。为了减轻此问题,通常将传感器配置为以相对较低的采样频率运行,从而减少了一组观测值。然而,这可能会妨碍随后的决策,例如预测。为了解决这一问题,在这项工作中,我们评估了在高度不确定的情况下的短期预测,即,传感器流的数量远高于观测值的数量。相对于五个不同的现实世界数据集的最终预测准确性,对几种统计,机器学习和基于神经网络的模型进行了彻底检查。将重点放在统一的实验协议上,专门针对物联网边缘的多个时间序列的短期预测设计。所提出的框架可以被视为在资源约束的物联网应用程序中建立可靠的预测策略的重要步骤。
translated by 谷歌翻译
Twitter是吸引数百万用户最受欢迎的社交网络之一,而捕获了相当大的在线话语。它提供了一种简单的使用框架,具有短消息和有效的应用程序编程接口(API),使研究界能够学习和分析这一社交网络的几个方面。但是,Twitter使用简单可能会导致各种机器人的恶意处理。恶意处理现象在线话语中扩大,特别是在选举期间,除了用于传播和通信目的的合法机床之外,目标是操纵舆论和选民走向某个方向,特定意识形态或政党。本文侧重于基于标记的Twitter数据来识别Twitter机器的新系统的设计。为此,使用极端梯度升压(XGBoost)算法采用了监督机器学习(ML)框架,其中通过交叉验证调整超参数。我们的研究还通过计算特征重要性,使用基于游戏理论为基础的福价来解释ML模型预测的福利添加剂解释(Shap)。与最近最先进的Twitter机器人检测方法相比,不同的Twitter数据集的实验评估证明了我们的方法的优越性。
translated by 谷歌翻译
The cyber-physical convergence is opening up new business opportunities for industrial operators. The need for deep integration of the cyber and the physical worlds establishes a rich business agenda towards consolidating new system and network engineering approaches. This revolution would not be possible without the rich and heterogeneous sources of data, as well as the ability of their intelligent exploitation, mainly due to the fact that data will serve as a fundamental resource to promote Industry 4.0. One of the most fruitful research and practice areas emerging from this data-rich, cyber-physical, smart factory environment is the data-driven process monitoring field, which applies machine learning methodologies to enable predictive maintenance applications. In this paper, we examine popular time series forecasting techniques as well as supervised machine learning algorithms in the applied context of Industry 4.0, by transforming and preprocessing the historical industrial dataset of a packing machine's operational state recordings (real data coming from the production line of a manufacturing plant from the food and beverage domain). In our methodology, we use only a single signal concerning the machine's operational status to make our predictions, without considering other operational variables or fault and warning signals, hence its characterization as ``agnostic''. In this respect, the results demonstrate that the adopted methods achieve a quite promising performance on three targeted use cases.
translated by 谷歌翻译
Probabilistic Boolean Networks have been proposed for estimating the behaviour of dynamical systems as they combine rule-based modelling with uncertainty principles. Inferring PBNs directly from gene data is challenging however, especially when data is costly to collect and/or noisy, e.g., in the case of gene expression profile data. In this paper, we present a reproducible method for inferring PBNs directly from real gene expression data measurements taken when the system was at a steady state. The steady-state dynamics of PBNs is of special interest in the analysis of biological machinery. The proposed approach does not rely on reconstructing the state evolution of the network, which is computationally intractable for larger networks. We demonstrate the method on samples of real gene expression profiling data from a well-known study on metastatic melanoma. The pipeline is implemented using Python and we make it publicly available.
translated by 谷歌翻译
如今,越来越多的数据集已发布针对系统和模型的研究和开发,从而直接比较,解决方案的持续改进以及研究人员参与实验,现实生活数据。但是,尤其是在结构健康监测(SHM)领域中,在许多情况下,新的研究项目具有结构设计和实施,传感器选择和技术推动因素的独特组合,这些组合不符合相关个人研究的配置文学。因此,由于我们没有找到任何相关存储库,因此我们将案例研究中的数据分享到研究界。更具体地说,在本文中,我们提出了一个新颖的时间序列数据集,用于使用陶瓷压电传感器(PZTS)连接到物联网(IOT)设备(IOT)设备的陶瓷压电传感器(PZTS),用于塑料薄板上的撞击检测和本地化,朝着结构性健康监测应用。数据集是从低速,低能冲击事件的实验过程中收集的,该过程包括每个独特的实验至少3个重复,而输入测量值来自放置在板的角落的4个PZT传感器。对于每个重复和传感器,以100 kHz的采样率存储5000个值。该系统用钢球激发,释放的高度从10厘米到20厘米不等。该数据集可在GitHub(https://github.com/smart-objects/impact-events-dataset)中获得。
translated by 谷歌翻译
持续学习的现有工作(CL)的重点是减轻灾难性遗忘,即学习新任务时过去任务的模型绩效恶化。但是,CL系统的训练效率不足,这限制了CL系统在资源有限的方案下的现实应用。在这项工作中,我们提出了一个名为“稀疏持续学习”(SPARCL)的新颖框架,这是第一个利用稀疏性以使边缘设备上具有成本效益的持续学习的研究。 SPARCL通过三个方面的协同作用来实现训练加速度和准确性保护:体重稀疏性,数据效率和梯度稀疏性。具体而言,我们建议在整个CL过程中学习一个稀疏网络,动态数据删除(DDR),以删除信息较少的培训数据和动态梯度掩盖(DGM),以稀疏梯度更新。他们每个人不仅提高了效率,而且进一步减轻了灾难性的遗忘。 SPARCL始终提高现有最新CL方法(SOTA)CL方法的训练效率最多减少了训练失败,而且令人惊讶的是,SOTA的准确性最多最多提高了1.7%。 SPARCL还优于通过将SOTA稀疏训练方法适应CL设置的效率和准确性获得的竞争基线。我们还评估了SPARCL在真实手机上的有效性,进一步表明了我们方法的实际潜力。
translated by 谷歌翻译
本文介绍了Hipart软件包,这是一个开源的本机Python库,可提供有效且可解释的分裂分层聚类算法的实现。HIPART支持交互式可视化,以操纵执行步骤,从而直接干预聚类结果。该软件包非常适合大数据应用程序,因为重点是实现的聚类方法的计算效率。所使用的依赖项是Python Build-In-In套件或高度维护的稳定外部软件包。该软件是根据MIT许可证提供的。该包的源代码和文档可以在https://github.com/panagiotisanagnostou/hipart上找到。
translated by 谷歌翻译
大多数现有的机器人收割机都使用单一的方法;单臂通过分离运动抓住农作物并将其脱离,或者通过特殊设计的抓地力/切割器最终效果切割茎。但是,这种单人的解决方案不能用于敏感的农作物和杂乱的环境(如葡萄和葡萄园),其中障碍物可能会阻塞茎并且没有空间容纳切割机的放置。在这种情况下,该解决方案将需要一个双人机器人,以便在视觉上揭开茎并操纵抓地力的作物,以创建与人类使用的实践相似的切割负担能力。在这项工作中,提出了一种达到茎预切口状态的双臂协调运动控制方法。配备刀具的摄像头正到达茎,尽可能将其揭开,而第二臂则将握住的农作物移向周围的自由空间,以促进其茎切割。在使用塑料葡萄簇的模型葡萄藤设置进行实验室实验可评估所提出的方法,涉及两个UR5E机器人臂和一个Realsense D415摄像头。
translated by 谷歌翻译
当结果具有高维度时(例如基因表达,脉冲反应,人类的面部)和协方差相对有限,对传统因果推理和监督学习方法的估算是一项具有挑战性的任务。在这种情况下,要在反事实治疗下构建一个人的结果,至关重要的是要利用其在协变量之上观察到的事实结果中包含的个人信息。我们提出了一个深层的变异贝叶斯框架,该框架严格整合了在反事实处理下进行结果构建的两个主要信息来源:一个来源是嵌入高维事实结果中的个体特征;另一个来源是实际收到这种利益疗法的相似受试者(具有相同协变量的受试者)的响应分布。
translated by 谷歌翻译
重建和分类误差的关节优化是一个难题的问题,尤其是当使用非线性映射时。为了克服这一障碍,提出了一种新颖的优化策略,其中将降低维度的卷积自动编码器和由完全连接的网络组成的分类器组合在一起,以同时产生监督的维度降低和预测。事实证明,这种方法也可以极大地有益于深度学习体系结构的解释性。此外,可以利用针对分类任务进行优化的最终潜在空间来改善传统的,可解释的分类算法。实验结果表明,所提出的方法对最先进的深度学习方法实现了竞争结果,同时在参数计数方面更有效。最后,从经验上证明,所提出的方法论介绍了关于通过产生的潜在空间的数据结构,还涉及分类行为的高级解释性。
translated by 谷歌翻译